Aprendizaje Automático versus Expresiones Regulares en la Detección de la Negación y la Especulación en Biomedicina

نویسندگان

  • Noa P. Cruz Díaz
  • Manuel J. Maña López
  • Jacinto Mata Vázquez
چکیده

In this paper, we present a machine learning system that identify the negation and speculation signals in biomedical texts, in particular, in the BioScope corpus. The objective of this research is to compare the efficiency of this approach focused on machine learning with which it is based on regular expressions. Among the systems that follow the latter approach, we used NegEx because of its availability and popularity. The evaluation has been carried out on the three subcollections which make up Bioscope: clinical documents, scientific papers and abstracts of scientific articles. The results show the superiority of the approach based on machine learning over the use of regular expressions. In the detection of expressions of negation, the proposed system improves the F1 measure of NegEx by between 20 and 30%, depending on the collection of documents. In the speculation detection, the proposed system outperforms the F1 measure of the best system between 10 and 20%.

برای دانلود رایگان متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Análisis de sentimientos multilingüe en la Web 2.0

Nuestra propuesta consiste en un sistema de análisis de sentimientos h́ıbrido, que consiste una aproximación h́ıbrida, ya que utiliza un léxico de palabras etiquetadas según su polaridad, además de aprendizaje automático. El léxico se genera de manera automática a partir de un corpus etiquetado, y se asigna a cada término del texto una puntuación para cada polaridad. El aprendizaje automático se ...

متن کامل

Estudio exploratorio de defectos en registros de meta-datos IEEE LOM de objetos de aprendizaje

Resumen. Este artículo presenta un estudio realizado para la detección de defectos en registros de metadatos de objetos de aprendizaje. El estudio se realizó en dos asignaturas relacionadas con el aprendizaje online y los objetos de aprendizaje, cada una en una universidad española diferente, donde alumnos de postgrado tuvieron que rellenar registros de metadatos IEEE LOM como parte de los come...

متن کامل

Prólogo. Artículos seleccionados de IEEE ICALT 2008

Learning Technologies (IEEE ICALT), que está patrocinada por la sociedad IEEE y, en concreto, por el Comité Técnico sobre Tecnologías para la Educación (IEEE TCLT), es una de las más prestigiosas en su dominio. En el verano de 2008, la Universidad Carlos III de Madrid organizó su octava edición en Santander (España) siendo un éxito tanto en el número de ponencias recibidas para ser evaluadas co...

متن کامل

Impacto de la ironía en la minería de opiniones basada en un Léxico Afectivo

En este art́ıculo se describe un método sistemático que identifica la polaridad de textos en Español, aśı como el impacto de la irońıa en la mineŕıa de opiniones. Se propone una aproximación basada en un aprendizaje automático y en la extracción de caracteŕısticas a partir de un Léxico Afectivo en Español. Fue necesaria la creación de un corpus para el entrenamiento y evaluación del método propu...

متن کامل

Entre Grandes Datos Y Aprendizaje Automático Bitsbangtheory Oportunidades Para Emprender

automático Simulaciones, Control y Big Data ayudan a explicar el origen del universo en la “máquina de Dios”. Hace 20 años en las afueras de la multicultural ciudad de Ginebra, Suiza, s e c o m e n z ó a d e s a r r o l l a r e l experimento científico más complejo y desafiante construido por el hombre: se busca reproducir las condiciones del universo una milésima de billonésima de segundo lueg...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

عنوان ژورنال:
  • Procesamiento del Lenguaje Natural

دوره 45  شماره 

صفحات  -

تاریخ انتشار 2010